通常用于分析复杂数据集的维度减少和聚类技术,但它们的结果通常不容易解释。我们考虑如何支持用户在散点图上解释视表位结构,其中轴不直接解释,例如使用维度减少方法将数据投射到二维空间上。具体地,我们提出了一种新方法来自动计算可解释的聚类,其中说明在原始的高维空间中,并且群集在低维投影中相干。它通过使用信息理论提供复杂性和所提供信息量之间的可调平衡。我们研究了这个问题的计算复杂性,并对解决方案的搜索空间引入了高效,可调,贪婪优化算法的限制。此外,该算法还在称为excus的交互式工具中实现。几个数据集的实验突出显示,excrus可以提供信息丰富的和易于理解的模式,并且他们公开了算法有效的地方,并且考虑到可调性和可扩展性的余地有改进的空间。
translated by 谷歌翻译
许多用户转向记录检索系统(例如搜索引擎)以寻求有争议的问题的答案。回答此类用户查询通常需要识别Web文档中的响应,并根据其不同的视角汇总响应。经典文档检索系统在为用户提供一系列直接和不同的响应时下降。当然,识别文档中的此类答复是一种自然语言理解任务。在本文中,我们研究了用文件检索综合这种语言理解目标的挑战,并研究了一个新的视角导向文档检索范式。我们讨论并评估内在的自然语言理解挑战,以实现目标。在设计挑战和原则之后,我们展示并评估了一个实用的原型管道系统。我们使用原型系统进行用户调查,以便评估我们的范例的效用,并理解用户信息需要有争议的查询。
translated by 谷歌翻译